sPerC : um classificador baseado em perturbação para dados multimodais

SOARES, Rodolfo José de Oliveira

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/39284

Comparte esta pagina

Título :	sPerC : um classificador baseado em perturbação para dados multimodais
Autor :	SOARES, Rodolfo José de Oliveira
Palabras clave :	Inteligência computacional; Perturbações; Multimodalidade; Agrupamento de dados
Fecha de publicación :	7-oct-2020
Editorial :	Universidade Federal de Pernambuco
Citación :	SOARES, Rodolfo José de Oliveira. sPerC: um classificador baseado em perturbação para dados multimodais. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020.
Resumen :	Na literatura, a teoria bayesiana é amplamente utilizada como base para a geração de novos modelos supervisionados, dada sua robustez em diversos contextos. Entre as diferentes técnicas embasadas no modelo estatístico, o classificador baseado em perturbações (PerC, do inglês Perturbation-based Classifier) utiliza as alterações ocorridas nos parâmetros 𝜇^ e Σ^, chamadas de Δ𝜇^ e ΔΣ^, para rotular novas amostras, tendo seu desempenho comprovado em vários cenários. Entretanto, quando o PerC é submetido a problemas que seguem uma distribuição multimodal, sua performance, e seu poder de generalização, degradam. Neste contexto, a multimodalidade pode ser observada quando exemplos de uma mesma classe formam grupos (clusters) dispersos no espaço de características. Assim, a multimodalidade aumenta a complexidade dos dados, reduzindo o nível de discernimento dos vetores médios e matrizes de covariâncias estimadas pelo classificador PerC. Para preencher essa lacuna, este trabalho apresenta uma nova abordagem de classificação para o algoritmo PerC, intitulada sPerC (do inglês, subconcept PerC), no qual utiliza o algoritmo K-Means para particionar os dados do problema em clusters, fornecendo-os como entrada para a técnica PerC, com o intuito de aprimorar o poder de generalização do modelo. A partir da combinação de 4 diferentes clustering validation índices, o valor do parâmetro 𝐾 é estimado para o algoritmo K-Means. Vale destacar que nenhum conhecimento prévio, sobre os domínios em estudo, é levado em consideração ao definir o valor do parâmetro. Experimentos foram conduzidos usando 30 bases de dados disponíveis nos repositórios KEEL e UCI Machine Learning, comparando o desempenho do método proposto em relação as técnicas PerC (versão original), Árvore de Decisão, k-NN, Multilayer Perceptron (MLP), Naïve Bayes, Random Forest e Support Vector Machine (SVM). Os resultados demonstraram a eficácia do trabalho proposto, alcançando desempenho competitivos em relação aos métodos Random Forest e Árvore de Decisão, e sendo significativamente superior aos algoritmos PerC, MLP e SVM, segundo os testes estatísticos de Wilcoxon e Friedman. Por fim, 22 medidas de complexidade foram adotadas na extração de características das bases de dados e utilizadas na construção de um meta-learning dataset para descrever os cenários favoráveis para a aplicação do método sPerC, a partir de um meta-classificador.
URI :	https://repositorio.ufpe.br/handle/123456789/39284
Aparece en las colecciones:	Dissertações de Mestrado - Ciência da Computação

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
DISSERTAÇÃO Rodolfo José de Oliveira Soares.pdf		1.27 MB	Adobe PDF	Visualizar/Abrir

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro Dublin Core completo del ítem Recomiende este ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons